首页> 外文OA文献 >Cross-Lingual Morphological Tagging for Low-Resource Languages
【2h】

Cross-Lingual Morphological Tagging for Low-Resource Languages

机译:低资源语言的跨语言形态标记

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Morphologically rich languages often lack the annotated linguistic resourcesrequired to develop accurate natural language processing tools. We proposemodels suitable for training morphological taggers with rich tagsets forlow-resource languages without using direct supervision. Our approach extendsexisting approaches of projecting part-of-speech tags across languages, usingbitext to infer constraints on the possible tags for a given word type ortoken. We propose a tagging model using Wsabie, a discriminativeembedding-based model with rank-based learning. In our evaluation on 11languages, on average this model performs on par with a baselineweakly-supervised HMM, while being more scalable. Multilingual experiments showthat the method performs best when projecting between related language pairs.Despite the inherently lossy projection, we show that the morphological tagspredicted by our models improve the downstream performance of a parser by +0.6LAS on average.
机译:形态丰富的语言通常缺少开发准确的自然语言处理工具所需的带注释的语言资源。我们提出了适合在不使用直接监督的情况下针对低资源语言使用丰富标签集来训练形态标签的模型。我们的方法扩展了跨语言投影词性标签的现有方法,使用bitext推断给定单词类型或令牌的可能标签的约束。我们提出使用Wsabie的标记模型,这是一种基于判别式嵌入的模型,具有基于排名的学习方法。在我们对11种语言的评估中,该模型的平均性能与基线弱监督的HMM相当,同时具有更高的可扩展性。多语言实验表明,该方法在相关语言对之间进行投影时效果最佳。尽管存在固有的有损投影,但我们表明,我们的模型预测的形态学标记将解析器的下游性能平均提高了+ 0.6LAS。

著录项

  • 作者

    Buys, Jan; Botha, Jan A.;

  • 作者单位
  • 年度 2016
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号